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jj 要 : 近年 来 ， 高 质量 社区 的 挖掘 和 发 现 已 经 成 为 社会 网 络 研究 的 一 个 热点 。 提 出 一 种 基于 节点 属性 的 社区 发 现 博 
3-5-:k G NA (game algorithm based on node attributes for community detection ) 。 将 社区 发 现 的 过 程 看 做 网 络 中 节点 的 
博弈 ， 当 所 有 节点 都 不 能 提高 自身 收益 时 ， 博 弃 结 束 。 首 先 ，G_NA 提出 基于 节点 度 属 性 的 收益 函数 ; RE, ARR 
过 程 中 ， 节 点 按照 重要 度 从 大 到 小 排序 ， 并 依次 选择 策略 提高 收益 ; 最 后 ， 将 提出 的 算法 与 现 有 算法 分 别 在 不 同 的 真 
实 网 络 和 人 工 网 络 上 进行 对 比 实验 ， 结 果 表 明 提 出 的 算法 优 于 其 他 算法 。 
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Game algorithm based on node attributes for community detection 


Zhang Xiankun, Ren Jing, Liu Yuanbo, Su Jing 
(School of Computer Science & Information Engineering, Tianjin University of Science & Technology, Tianjin 300457, China) 


Abstract: In recent years, the detection of high-quality communities has become a hot topic in social network research. This 
paper proposes a game algorithm based on node attributes for community detection (G. NA) . This paper regards the process of 
community detection as the game of nodes in the network. When all nodes cannot improve their own utilities, the game ends. 
First, G. NA proposes a utility function based on the node degree attribute. Then, during the iteration, the nodes update the 
strategies in a sequence of node influence from large to small to increase their utilities. Finally, the proposed algorithm is 
compared with the existing algorithm in different real networks and artificial networks. The results show that the proposed 
algorithm is superior to other algorithms. 
Key words: community detection; game; node attributes; utility function 
RS 次 迭代 。 所 以 效率 不 高 ， 算 法 准确 度 也 会 降低 。GN 算法 是 一 
个 删除 边 的 算法 ， 本 质 是 基于 聚 类 中 的 分 裂 思想 ， 在 原理 上 是 
复杂 网 络 是 复杂 系统 的 抽象 ， 现 实 中 许多 复杂 系统 都 可 以 ”使 用 边 介 数 作为 相似 度 的 度量 方法 。 在 GN 算法 中 ， 每 次 都 会 
用 复杂 网 络 的 相关 特性 进行 描述 和 分 析 。 用 图 中 的 节点 表示 系 ”选择 边 介 数 高 的 边 删 除 ， 进 而 网 络 分 裂 速度 远 快 于 随机 删除 边 
统 中 的 个 体 , 边 表示 个 体 之 间 的 关系 50。 其 中 社区 结构 是 复杂 ”时 的 网 络 分 裂 。GN 算法 不 知道 最 后 会 有 多 少 个 社区 ; 在 计算 
网 络 中 的 一 个 普遍 特征 ， 整 个 网 络 由 许多 个 社区 组 成 。 同 一 社 。 边 介 数 的 时 候 可 能 会 有 很 对 重复 计算 最 短路 径 的 情况 。 
区 内 的 节点 与 节点 之 间 的 连接 很 紧密 ， 而 社区 与 社区 之 间 的 连 Newman 提出 模块 度 Q 后 ， 研 究 者 提出 模拟 退火 、 极 值 优 化 等 
赚 比 较 稀 琉 。 若 任意 两 个 社区 的 节点 集合 的 交集 均 为 空 ， 则 是 。 基于 模块 度 的 方法 ， 将 社区 划分 问题 转化 为 优化 问题 ， 进 而 寻 
非 重 炙 社区 ， 否 则 为 重 炙 社区 。 对 复杂 网 络 的 研究 一 直 是 很 多 ” 找 一 个 目标 函数 的 最 优 解 。 
会 
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领域 的 研究 热点 ， 如 蛋白 质 结构 分 析 、 城 市 道路 建设 以 及 社 2010 Œ, Chen 等 人 四 首次 将 博弈 论 用 于 社区 发 现 , 提出 基 
营销 领域 。 随 着 微 博 、Facebook 等 社交 软件 的 出 现 ， 对 于 复杂 ” ”于 博弈 论 的 社区 发 现 算法 ,但 是 算法 没有 考虑 节点 自身 的 属性 ， 
网 络 社 区 结构 的 研究 更 重要 。 随机 选择 初始 节点 造成 实验 结果 随机 性 很 大 。 本 文 在 Chen 等 
前 社区 发 现 的 算法 主要 有 谱 二 分 法 、K-L 算法 等 图 分 割 人 研究 的 基础 上 ， 提 出 基于 节点 属性 的 社区 发 现 博弈 算法 
Ak: GN 算法 等 分 裂 方法 ， 模 拟 退 火 、 极 值 优 化 等 基于 模块  G_NA。 首 先 ， 本 文 提出 基于 节点 度 属 性 的 收益 函数 ， 该 收益 
度 的 方法 等 。 其 中 K-L 算法 必须 预先 制定 两 个 社区 的 大 小 , 否 ”函数 是 对 Chen 等 收益 函数 的 一 种 修正 ; 然后， 在 迭代 过 ae 
则 不 会 得 到 正确 的 划分 结果 ， 因 此 实际 应 用 范围 很 小 。 谱 二 分 。 节点 按照 重要 度 从 大 到 小 排序 ， 并 依次 选择 策略 提高 收益 

法 一 次 只 能 划分 两 个 社区 ， 如 果 需 要 划分 多 个 社区 ， 则 需要 多 后， 将 本 文 提出 的 算法 与 现 有 算法 分 别 在 不 同 的 真实 网 络 和 人 
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工 网 络 上 进行 对 比 实验 ， 结 果 表 明 本 文 的 算法 优 于 其 他 算法 。 
本 文 的 主要 贡献 有 : a) 提出 了 一 种 基于 节点 属性 的 社区 发 现 博 
弈 算法 ，b) 提出 了 一 个 基于 节点 度 属性 的 收益 函数 ，c) 博弈 
中 将 节点 按照 重要 度 从 大 到 小 排序 进行 策略 选择 ; dO 本 文 算法 
对 要 检测 的 社区 的 大 小 和 数量 没有 限制 。 


1 ”相关 工作 


11 博弈 论 简介 
1.1.1 博 弃 论 的 定义 
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足 a=argmaxP(a) 的 a 都 是 纳什 均衡 点 。 


1.2 Game 算法 

2010 年 ，Chen 等 人 提出 一 种 基于 博弈 论 的 社区 发 现 算法 ， 
将 博 弃 论 用 于 社区 检测 。 其 算法 的 主要 思想 是 : 将 复杂 网 络 的 
社区 形成 过 程 建 横 为 社区 形成 博弈 。 将 网 络 中 的 每 个 个 体 视 为 
自私 的 参与 者 。 每 个 节点 通过 加 入 、 离 开 和 转换 社区 提高 自己 
的 收益 ， 直 到 算法 达到 纳什 均衡 ， 此 时 得 到 的 网 络 结构 为 最 终 
的 社区 结构 .这 个 框架 反映 了 现实 网 络 中 社区 的 有 机 形成 过 程 。 


填 弈 论 印 是 关于 参与 人 策略 相互 作用 的 理论 。 博弈 论 考虑 
填 弈 中 个 体 的 预测 行为 及 实际 行为 ， 并 研究 它们 的 优化 策略 。 
当 个 体 利益 存在 冲突 时 ， 每 个 个 体 所 获得 的 利益 除了 取决 于 自 
己 所 获取 的 行动 ， 还 依赖 于 其 他 个 体 采取 的 行动 ， 每 个 个 体 都 
需要 针对 对 方 的 行为 选择 做 出 对 自己 最 有 利 的 反应 。 

1.1.2 博弈 论 的 要 素 

博弈 论 要 素 包括 参 与 人 、 策 略 、 收 益 、 均 衡 等 ， 其 中 参与 
人 、 策 略 及 收益 是 最 基本 的 博弈 要 素 。 参 与 人 是 博弈 中 的 决策 
主体 ， 其 通过 选择 策略 最 大 化 自己 的 收益 ， 参 与 人 可 以 是 自然 


人 、 团 体 、 自 然 等 。 
参与 人 i 的 策略 集 S, ={s;} 是 其 可 行 策略 的 集合 。 策略 组 合 
S —(5,,55,.5,) 是 由 参与 博弈 的 每 个 参与 人 选择 一 个 策略 所 组 


成 的 一 个 有 序 集 。 
1.1.3 纳什 均衡 

纳什 均衡 四 是 指 这 样 的 策略 组 合 : 为 了 最 大 化 自己 的 收益 ， 
每 个 参与 人 所 采取 的 策略 一 定 是 关于 其 他 参与 人 所 采取 策略 的 
最 佳 策略 。 因 此 作为 理性 参与 人 ， 没 有 一 个 参与 人 会 轻率 地 偏 
离 这 个 策略 组 合 而 使 自己 利益 受 损 。 

定义 1 纳什 均衡 。 在 有 n 个 参与 人 的 博弈 
G —- (5,,5,...8,:14,,,...4,) 中 ,策略 组 合 = CS, SS) 是 一 个 纳 
什 均衡 ， 如 果 对 于 每 一 个 5 s 是 给 定 其 他 参与 人 的 选择 ， 
S-i = (5,515 -5,) 的 情况 下 ， 第 i 个 人 的 最 优 策略 ， 即 
uS; ,5,) Zu 5,) ,对 所 有 的 ie 荆 或 者 用 另 一 种 表示 方式 , s; 
是 s; eargu CS sS So SaS) ，i=1,2,.…n 的 最 大 化 问题 的 解 。 


算法 的 收益 函数 是 由 增益 函数 和 损失 函数 构成 。 
Chen 等 算法 中 的 增益 函数 是 


dd, 


2m 


1 ae 
QD = FF l0 ôli, j)— -|L oL) Q) 


Chen 等 算法 中 的 损失 函数 是 
&i(D=( |-D'c (3) 
Chen 等 算法 的 基本 流程 是 : 
a) 初始 化 每 个 节点 为 单独 社区 ; 
b) 随机 选择 节点 选择 其 最 佳 策略 ; 
c) 循环 步骤 b)， 直 到 达到 纳什 均衡 。 
Chen 等 算法 的 不 足 之 处 有 : 
a) 节点 选择 策略 顺序 随机 ， 造 成 实验 划分 结果 不 稳定 ; 
b) 没 有 考虑 节点 自身 属性 对 节点 在 网 络 中 选择 策略 时 的 权 
利 及 参与 性 。 
在 Chen 等 人 算法 的 基础 上 ， 很 多 研究 者 做 了 算法 的 改进 ， 
主要 是 收益 函数 和 策略 方向 的 改进 。 例 如 ，2011 年 ，Alvari 等 
出 基于 节点 相似 度 的 收益 函数 ， 并 提出 一 种 新 的 节点 相 
似 度 ， 但 是 实验 效果 并 不 好 。2017 F, Zhou 等 人 外 将 博弈 论 用 
于 社区 发 现 ， 根 据 节点 的 相似 度 提 出 收益 函数 ， 并 提出 两 种 节 
点 的 更 新 策略 。 但 是 这 些 已 有 的 算法 均 没 有 考虑 节点 自身 属性 
在 博弈 中 收益 及 节点 博弈 顺序 的 影响 。 


m. 


2 GNA 算法 
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基于 对 已 有 社区 发 现 算法 的 分 析 ， 本 文 提 出 一 种 基于 


因此 ， 如 果 一 个 策略 组 合 中 ， 不 存在 一 个 参与 人 可 以 单方 
面 改 变 自 己 的 策略 而 提高 收益 ， 这 个 策略 组 合 就 是 纳什 均衡 。 
1.1.4 潜在 博弈 与 潜在 函数 

潜在 博弈 中 是 一 种 特殊 类 型 的 博弈 方法 ， 收 敛 性 是 它 的 一 
个 重要 性 质 。 对 于 潜在 博弈 ,存在 一 个 局 部 线性 的 潜在 函数 P 
能 反映 参与 者 i 策略 单独 发 生 改 变 时 收益 函数 的 变化 量 。 形 式 
化 描述 为 


u, (s; s ;) —u; (s,.8.,)2@,(P(s,.8,)-P(s,.s,)) (1) 


HH: 5,,9,€8,; P:So Rs ORREIK i KBE. 


纳什 均衡 规定 : 潜在 博弈 至 少 存在 一 个 纳什 均衡 点 ， 且 满 


节 

盟 性 的 社区 发 现 博弈 算法 一 一 G_NA。 算 法 将 社区 划分 的 过 程 
看 作 一 种 节点 之 间 的 博弈 。 给 定 一 个 复杂 网 络 ， 假 设 每 个 节点 
是 一 个 自私 的 参与 者 。 在 社区 形成 过 程 中 ， 每 个 节点 的 重要 性 
不 同 ， 决 定 其 选择 策略 的 顺序 不 同 ， 且 对 社区 形成 过 程 中 的 收 
益 贡 献 值 不 同 。 因 此 选择 一 种 节点 属性 初始 化 社区 ， 节 点 按照 
一 定 的 顺序 自己 选择 策略 提高 收益 。 社 区 结构 可 以 解释 为 博 研 
达到 均衡 时 的 状态 。 算 法 允许 每 个 节点 选择 多 个 社区 ， 这 样 可 
DARI Ay EE EX 

给 定 静态 网 络 图 G- (V EA KP: n=|V|, m2|E|. 假设 G 
是 无 向 无 权 网 络 。 本 文中 ， 集 合 V 中 的 元 素 称 为 节点 或 代理 。 
每 个 节点 选择 其 想 加 入 的 社区 集合 。 所 有 可 能 的 社区 集合 表示 
为 [K]={1,2,…,k} 。 值 得 注意 的 是 ， 最终 得 到 的 社区 个 数 可 能 远 
NF ke 
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2.1 算法 的 收益 函数 给 定 任 一 网 络 ， 计 算 每 个 节点 的 重要 度 ， 按 照 重 要 度 值 从 
社会 网 络 中 , 节点 加 入 某 个 社区 使 得 自身 利益 提高 的 同时 ， 大 到 小 排列 节点 ， 令 节点 选择 策略 ， 直 到 收益 值 不 能 变 大 。 节 
会 付出 相应 的 代价 。 例 如 ， 员 工 由 原来 公司 跳槽 至 现在 公司 ， 点 的 策略 有 : 
在 工资 提高 的 同时 ， 会 伴随 着 原来 公司 的 违约 赔偿 。 因 此 ， 节 a) 加 入 : 节点 通过 在 工 中 加 入 一 个 新 的 标签 表示 它 加 入 
点 的 收益 由 增益 函数 和 损失 函数 共同 决定 。 本 文 基于 Newman 除 它 已 经 所 在 社区 之 外 的 社区 。 
模块 度 ， 并 加 入 节点 度 值 对 社区 收益 的 贡献 比例 ， 提 出 增益 函 bo AF: 节点 通过 在 工 中 移 除 一 个 标签 表示 它 离 开 该 社 
数 。 节 点 的 收益 是 节点 对 模块 度 的 贡献 量 。 因 此 , 基于 Newman [X 。 
模块 度 提 出 增益 函数 ， 在 增益 函数 中 加 入 节点 度 值 占 网 络 中 节 c) 转换 ;节点 通过 在 工 中 替换 一 个 标签 表明 它 从 一 个 社 
点 度 值 总 和 的 比例 ， 可 以 更 好 地 描述 节点 的 收益 。 区 转换 至 另 一 个 社区 。 
基于 Newman 模块 度 ， 并 加 入 节点 度 值 的 比例 。 本 文 提出 节点 的 策略 分 别 如 图 1~3 所 示 。 每 个 图 中 虚线 分 隔 的 节点 
的 第 i 个 节点 的 增益 函数 为 组 成 不 同 的 社区 ， 从 左 到 右 编号 为 1，2 
gi(L ri E) (4) 3 
: i e. 
其 中 ; ILOLE, (5j) -1, 否则 6(i 站 =0。 AGH ü 
邻接 矩阵 ， 记 是 节点 站 加 入 节点 了 BTCA REALE, Pit " | 
算 方 式 如 下 : ee 
Sane d, = 
ST (5) (b) 
idea ^ (a) 
其 中 : Ci) 表示 节点 7 所 在 社区 的 节点 集合 ，7 表 示 节 点 图 1 节点 加 入 社区 策略 示意 图 
j 所 在 社区 中 的 节点 ， 包 括 新 加 入 的 节点 i。 Fig.l Schematic diagram of node joining community 
1 表示 节点 的 加 入 社区 策略 。 在 图 1 Ca) 中 节点 1 属于 
本 文 的 损失 函数 为 -pL, Jb. m 为 网 络 中 ii oe 
2m 社区 2， 其 标签 为 Li2(2); 图 1 (bo 中 ， 当 节点 1 加 入 社区 1 
后 ， 其 标签 为 L={2,1}。 
的 边 数 ， Ll 为 节点 i 的 社区 标签 。 Te 
因此 ， 收 益 函 数 4()= 8;() 一 1()， 即 e 
sm | \ 
»»à. 2 [A567 ad, un 小 Lia (6) é ] 
前 面 已 经 介绍 过 ,潜在 博弈 是 允许 纯 纳什 均衡 的 一 类 博弈。 | i 
在 潜在 博弈 中 ， 在 节点 的 策略 选择 中 定义 了 相关 的 洪 在 函数 (a) b) 


DC) 。 如 果 对 每 个 策略 空间 L 和 每 个 节点 v, BENE L 有 


DL -DL,,L)=u(L,,L)-u(D) ， 则 社区 形成 博弈 是 潜在 博 
弈 。 显 然 ， 本 文 提出 的 收益 函数 关于 1/2 线性 ， 所 以 博弈 为 潜 


在 博弈 ， 可 以 达到 纳什 均衡 。 
2.2 节点 的 策略 
在 本 文 的 社区 形成 博弈 中 ， 节 点 wsy 的 策略 是 其 想 加 入 
的 社区 的 子 集 , 也 就 是 TAI IE. EM L CAAT AY, eV 的 
策略 ， 也 称 之 为 节点 vieV 的 社区 标签 。 人 允许 五 = 筷 ， 也 就 是 
节点 veV 可 以 不 属于 任何 社区 。 定 义 世 = (2 LsL) 为 策略 
空间 ， 也 就 是 所 有 节点 的 社区 标签 的 一 个 向 量 。 

令 除 i 之 外 节点 的 社区 标签 为 L; ， 用 (LL) 表示 策略 空 
间 ， 其 中 工 的 第 i NCR L RE. EY eV 的 收益 函数 为 
uL) - 8,02 -LUD 。 在 社区 形成 博弈 中 ,给 定 其 余 节 点 的 策略 


o 


L,, HAV EV 的 最 优 策略 为 Ymax s (s L) , 
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图 2 节点 离 


社区 策略 示意 图 


Fig.2 Schematic diagram of node leaving community 
2 表示 节点 的 离开 社区 策略 。 在 图 2 Ca) 中 节点 1 属于 
十 区 1，2， 其 标签 为 Li={1，2}; 图 2 (b) 中 ， 当 节点 工 离开 
社区 1 后， 其 标签 为 L1={2}。 


EU 


(b) 
(a) 


图 3 节点 转换 社区 策略 示意 图 


Fig.3 Schematic diagram of node converting in communities 


201811.00166v1 


— 


社区 2， 其 标签 为 L={2}; 图 3 (00 中 ， 当 节点 1 由 社区 2 转 
换 到 社区 1 后 ， 其 标签 为 Li-(1)« 
2.3 算法 描述 

本 文 首 先 对 节点 进行 重要 度 排 序 ， 进 而 依次 选择 策略 更 新 
收益 。 节 点 重要 度 用 于 度量 节点 在 整个 网 络 中 的 影响 力 ， 本 文 
采用 Zhang 等 人 0 提出 的 基于 贝 叶 斯 网 络 的 用 户 节点 重要 度 计 
算 方法 归 一 化 网 络 中 所 有 节点 求 出 的 重要 度 。 该 重要 度 是 基于 
先 验 属 性 得 到 的 重要 度 ， 仅 仅 根 据 节点 先 验 属性 计算 得 到 的 归 
一 化 影响 力 是 不 够 的 ， 因 为 网 络 中 节点 和 节点 之 间 存 在 紧密 的 
联系 ， 一 个 拥有 更 多 重要 度 节 点 链接 的 节点 会 更 加 重要 ， 节 点 
重要 度 越 大 ， 对 其 他 节点 的 影响 力 越 大 ， 节 点 越 有 权利 先进 行 
策略 选择 。 重 要 度 计算 公式 如 下 : 


2 T) 
JEN (i) 


其 中 : NIG) RANT it AEE; Inf 0 表示 节点 i 的 先 
Jo SEE. ot 表示 衡量 邻接 节点 重要 度 对 节点 i 影响 力 的 系数 ， 
取 值 为 0~1， 在 Zhang 等 人 的 论文 《Label propagation algorithm 
for community detection based on node importance and label 
influence) rf @ =0.4 IN, 实验 效果 最 佳 , 因此 本 文 实验 过 程 中 a 


jeNG) d( j) iR: 
dCj) RANT i BE 


取 值 为 0.4， 此 时 式 (7) 2 NIG) = Inf + 


中 : NG) 表示 节点 i 的 邻接 节点 集 ; 
点 j 的 度数 。 

本 文 提出 基于 节点 属性 的 社 
算法 设计 很 简单 ， 首 先 初始 化 每 个 节点 为 单独 社区 ， 计 算 节 点 
重要 度 ， 并 按 重要 度 值 从 大 到 小 排序 ， 然 后 设置 算法 迭代 次 数 
H1, 当 算 法 迭代 次 数 小 于 2 000 时 , 节点 依次 选择 策略 更 新 收 
益 ;， 最 后 输出 网 络 划分 结果 及 模块 度 值 。 算 法 主要 步骤 如 算法 
1 所 示 。 

算法 1 GNA 算法 步骤 

BOE: 基于 节点 属性 的 社区 发 现 博弈 算法 (G NAO 

输入 : 网 络 G=(V,E)。 

输出 : 网 络 社区 结构 ， 

a) begin 

b) 初始 化 每 个 节点 为 单独 社区 ， 初 始 化 收益 w=0; 

c) 计算 每 个 节点 的 重要 度 值 N1(i); 

d) 将 节点 按照 重要 度 值 从 大 到 小 排序 ， 得 到 节点 序列 ; 

e) do 

£ JEAN t=1; 

g 节点 选择 策略 并 根据 式 〈6) 计算 收益 

h) 选择 使 节点 收益 最 大 的 策略 ， 更 新 节点 的 社 

i) while 直到 算法 迭代 至 2000 次 ; 

p 得 到 社区 划分 结果 和 模块 度 值 ; 

k) end 


又 发 现 博弈 算法 一 一 G_NA。 


以 及 对 应 的 模块 度 值 。 


x] 
zi 
B > 
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图 3 表示 节点 的 转换 社区 策略 。 在 图 3 Ca) 中 节点 1 属于 


3 ”实验 分 析 


研究 者 通常 在 真实 网 络 和 仿 
效果 。 为 了 验证 本 文 提出 算法 的 性 
络 和 人 工 合成 网 络 上 进行 实验 。 
3.1 真实 网 络 上 的 社区 发 现实 验 
3.1.1 实验 数据 集 

本 文 在 Zachary 的 空手 道 俱 乐 部 网 络 〈Karate00)、 海 豚 网 
络 (Dolphins0)、 学 校 网 络 〈Friendship031)、 美 国政 治 书籍 网 
络 (Polbooks04) 和 美国 大 学 生 橄 槛 球 联 盟 网 络 (Football!!!) 
共 五 个 网 络 上 进行 实验 。 每 个 网 络 的 节点 数 和 边 数 如 表 1 所 示 。 
dl 真实 网 络 节点 数 和 边 数 


Table 1 Number of nodes and edges of real-world networks 


网 络 上 验证 社区 发 现 算法 的 
能 ， 本 文 分 别 在 真实 世界 网 


网 络 节点 数 边 数 
Karate 34 78 
Dolphins 62 159 
Friendship 69 220 
Polbooks 105 882 
Football 115 613 
表 1 是 本 文 所 用 的 真实 网 络 的 节点 数 和 边 数 。 从 上 到 下 ， 


网 络 节点 数 增多 ， 边 数 增多 ， 
3.1.2 实验 结果 评价 指标 
本 文采 4 提出 的 模块 度 O 评价 社区 发 现 效果 。 
2006 年 , Newman 提出 用 模块 度 2 评价 未 知 社区 结构 的 网 络 的 
社区 划分 结果 。 对 于 每 一 种 社区 划分 结果 ， 都 有 一 个 模块 度 Q 
值 来 判断 划分 结果 的 好 坏 。 它 的 物理 含义 是 社区 内 节点 之 间 连 
接 的 边 数 与 随机 情况 下 两 个 节点 之 间 连 接 边 数 的 差 。 对 于 无 权 


网 络 规模 变 大 。 


] Newman! 


图 可 以 理解 为 社区 内 部 边 的 度数 和 减 去 社区 内 节点 的 总 度数 。 
表达 式 为 
dd. 
o-a- blo) 8) 


其 中 ， 己 为 邻接 和 矩阵， 表示 节点 i 与 j 之 间 边 的 权 值 ， 对 于 无 


BUR, 


当 网 络 中 两 节点 之 间 有 连接 时 ， 肌 =1， 和 否则 沿 =0， d, 


; Ci 表示 i 所属 的 社区 ; m 表示 网 络 中 的 边 数 ，; 


节点 六 7 属于 同一 社区 时 ，5(c;c)) =, 


否则 5(c,c)) =0。 节点 j 连接 到 任意 节 


d. 
反 的 概率 是 7， 因此 随 


m 


dd, 
? Wis T, 


2m 


机 情况 下 ， 节 点 i 与 j 


2 的 取 值 是 [-1/2， 1]. 33 2 越 接 近 1， 说 明 社 区 划分 越 明 
To O 值 不 仅 可 以 衡量 社区 划分 的 准确 性 ， 也 可 以 判断 算法 对 
于 社区 划分 的 效果 。 
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3.1.3 实验 结果 与 分 析 


本 文 算法 G_NA 对 Karate, Dolphins, Friendship, Polbooks 
4(a)~(e) 所 示 。 


以 及 Football 网 络 的 划分 结果 分 别 如 图 


张 贤 坤 ， 等 : 基于 节点 属性 的 社区 发 现 博弈 算法 


6 7 


(a) G. NA 算法 对 Karate po 2 fy #1 


上 区 划分 示意 图 


(a) Communities discovered for Zachary's karate club by G NA 
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(b) G. NA 算法 对 Dolphins 网 络 的 社区 划分 示意 图 


(b) Communities discovered for Dolphins network by G NA 


(c) G. NA 算法 对 Friendship 网 络 的 社区 划分 示意 图 


(c) Communities discovered for Friendship network by G_NA 


(d) G_NA 算法 对 Polbooks 网 络 的 社区 划分 示意 图 


(d) Communities discovered for Polbooks network by G_NA 


(e) G_NA 算法 对 Football 网 络 的 社区 划分 示意 
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(e) Communities discovered for Football network by G NA 


图 4 G NA 算法 对 真实 网 络 的 社区 划分 示意 


| 


Fig. 4 The communities discovered for the real-world networks by G NA 


4(a)~(e) 中 分 别 展 示 了 G_NA 算法 对 不 同 真实 网 络 的 社 


区 划分 结果 。 如 图 


成 5 个 社区 , 共 发 现 2 43 


4 (a) 所 示 ，G_NA 算法 将 Karate 网 络 划分 
RAW, 分 别 为 1 和 34。 如 图 4 Cb) 


所 示 ，G_NA 算法 将 Dolphins 网 络 划 分 为 12 个 社区 ， 共 发 现 


11 EAT 


HR. OHA 1. 2. 9. 15. 16, 18, 21. 31, 48, 


52. 55. WE 4 中 c) 所 示 ，G_NA 算法 将 Friendship 网 络 划分 


发 现 9 SEAT 


为 5 个 社区 ， 共 发 现 2 个 重 


闭 节 点 ， 分 别 为 15 和 47。 如 图 4 
(d) 所 示 ，G_NA 算法 将 Polbooks 网 络 划 分 为 7 个 社区 ， 共 
点 ,分 别 为 10、11、13、15、21、48、68、85、 


100。 如 图 4 (e) 所 示 ，G_NA 算法 将 Football 网 络 划 分 为 6 


个 社 [X , 


ERIN 5 个 和 
(24 7 RATS 
可 以 看 出 G_NA 算法 与 以 前 的 而 


究 相 比 发 现 了 更 


点 ， 分 别 为 10、24、37、45、51。 


TF 


语 的 
E sl 


pin 


Lim 


SAM). G NA SULA URMA ERREK, CRY Ue 


供 关 于 社区 结构 的 更 多 有 意义 的 信息 。 从 实验 结果 可 以 得 出 结 


于 社区 互联 和 更 大 衬 


对 比 ， 实 验 结果 如 图 5 所 示 。 


的 社区 结构 ， 并 可 用 


W: GNA 算法 能 够 发 现 比 以 前 的 社区 发 现 方法 更 精细 的 社区 。 
这 些 更 加 细密 的 社区 揭示 了 网 络 中 更 详细 
上 区 结构 的 进一步 研究 。 
本 文 将 G_NA 算法 与 Game、LPA_NI 和 LEM09 算 法 进行 


—9— G NA 
| | 一 “一 Game 
—5— LPA NI 
—— LFM 


图 5 


60 


70 


RAAT x 


80 90 100 110 


点 数 


对 真实 网 络 划分 的 实验 结果 


Fig.5 Experimental results for real-world networks partitioning 


图 5 可 以 看 


上 ， 本 文 算法 对 真实 网 络 的 划分 效果 优 于 其 


他 算法 。 且 基于 博弈 论 的 Game 算法 对 网 络 的 划分 效果 优 于 
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LPA NI 算法 和 LFM 算法 ， 因 此 将 博弈 论 用 于 社区 发 现 具有 良 
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好 的 研究 前 景 和 研究 意义 。 
3.0 人工 网 络 上 的 社区 发 现实 验 


3.2.1 实验 数据 集 


本 文 对 人 工 网 络 的 社区 划分 实验 采用 的 仿真 网 络 为 LFR 


EMERIK. LFR 


EL HE Do] 2% HH Lancichinetti 等 人 07 提 出。 网 络 


PT 


on 表示 网 络 中 所 属 社 


车 节 点 所 属 的 社 


要 包括 以 下 参数 : N 表示 网 络 中 的 节点 数 ; k 表示 网 络 中 节点 
的 平均 度 ，maxk 表示 节点 的 最 高 度数 ，minc 表示 节点 数 最 少 
的 社区 中 的 节点 数 ，maxc 表示 节点 数 最 多 的 社区 中 的 节点 数 ; 
区 大 于 1 的 重合 节点 的 个 数 ，om 表示 重 
区 个 数 ，mu 为 混合 参数 ， 表 示 社 区 内 部 节点 


与 社区 外 部 连接 的 概率 ， 随 着 mu 值 增 大 ， 社 区 发 现 的 难度 变 
高 。LFR 基准 网 络 的 生成 参数 及 意义 如 表 2 所 示 。 可 通过 调节 
参数 产生 具有 重 半 性 和 层次 性 的 网 络 , 因此 LER-benchmark. 3E 


TEST SORGE 


x 发 现 算法 发 现 结果 的 测试 与 对 比 。 本 文生 成 
FFEA LFR 基准 网 络 的 参数 设置 如 表 3 所 示 。 生 成 重 车 LFR 
匡 准 网 络 的 参数 设置 如 表 4 所 示 。 


表 2 LFR 基准 网 络 的 生成 参数 


Table 2 Parameters of LFR networks 


参数 含义 

N 网 络 节点 数 

k 节点 平均 度 
maxk 节点 最 大 度 
minc 最 小 社区 规模 
maxc 最 大 社区 规模 
mu 混合 参数 

on 重合 节点 数 

om ET es rt KA 


本 文 分 别 生成 具有 200 节点 、500 节点 和 1 000 节点 的 3 


组 非 重 到 LER 网 络 。 每 组 LER 网 络 中 混合 参数 分 别 为 0.1、0.2、 


0.3， 如 表 3 所 示 


o 


表 3 dE LFR 网 络 的 生成 参数 


Table 3 Parameters of non-overlapping LFR networks 


网 络 编号 N k maxk minc maxc mu 
NO LFRI, 2, 3 200 5 8 10 30 0.1, 02, 0.3 
NO_LFR4, 5, 6 500 15 40 15 40 0.1, 0.2, 0.3 
NO LFR7, 8, 9 1000 30 50 20 50 0.1, 0.2, 0.3 


AS SCA) BUE EX ER E LEB 296. 496. 69650 S968] 2 组 
EA LER 网 络 。2 组 网 络 中 节点 数 分 别 为 200、1000。 节 点 数 
为 200 的 网 络 mu 值 为 0.1, 节点 数 为 1 000 的 网 络 mu 值 为 0.2， 


如 表 4 所 示 。 


表 4 HUE LFR 网 络 的 生成 参数 


Table 4 Parameters of overlapping LFR networks 


网 络 N k maxk minc maxc mu on om 
O_LFR1,2,3,4 200 5 8 10 30 0.1  4,8,12,16 2 
O_LFRS,6,7,8 1000 30 50 20 50 0.2 20,40,60,80 2 


3.2.2 实验 结果 评价 指标 
本 文采 用 互信 息 NMI 评价 算法 对 人 工 网 络 的 划分 结果 与 


人 工 网 络 


其 中 : z 


自身 社区 的 差异 度 。 互 信息 量 07 定 义 为 


ey B 
a(n*)= Y, tog) (10) 
A(2*)= Y; oa) (11) 

12,2) - X, Y, tog [Cy (12) 


m 分 别 表示 茶 个 社区 结构 ，x" 表示 社区 结构 x" 中 


社区 的 个 数 ; n 表示 在 社区 结构 z^ 中 第 h 个 社区 的 节点 数 ; mv 
表示 同时 在 x 中 的 第 h 个 社区 ， 在 x* 中 的 第 ! 个 社区 ， 这 样 


的 节点 的 个 数 。NMI 的 取 值 为 [0, 1], ERK, 表示 算 法 发 现 的 


社区 结构 


与 网 络 本 身 的 社区 结构 一 致 性 越 高 。 
3.2.3 实验 结果 与 分 析 


本 文 比较 G_NA 算法 与 Game 算法 对 人 工 网 络 的 划分 结 


图 6 


果 。 算 法 对 非 重叠 网 络 的 划分 结果 如 图 6 所 示 。 


(a) ~ Cc) 分 别 为 算法 在 200 个 节点 、500 个 节 


点 和 1 000 个 节点 的 网 络 上 的 划分 结果 。 由 图 6 Ca) 可 以 看 出 ， 
24 mu=0.1 时 , G_NA 算法 的 划分 结果 与 Game 算法 的 划分 结 


BOR ; 


(c) 可 以 看 出 ， 当 mu-0.1 Hf, Game 算法 的 划分 结 


果 优 于 GNA 算法 的 划分 结果 ， 但 是 从 (a) ~ (c) 可 以 看 出 ， 
当 mnu 值 增 大 时 ，G_NA 算法 的 划分 结果 明显 优 于 Game 算法 。 


因此 可 以 说 明 G_NA 算法 对 于 社区 结构 不 明显 的 网 络 划分 有 很 


大 优势 。 


—9— G NA 
一 “一 Game 


z 
z 
0.2 
0.1 
0.1 0.15 02 0.25 03 
混合 参数 ，mu 
Ca) 网 络 划分 结果 (N=200) 
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Fig.6 Detection results of non-overlapping networks 
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Fig.7 Detection results of Overlapping networks 


PS 


7 (a) CO 分 别 为 算法 在 N=200，mu=0.1 fll N=1000, 


mu=0.2 的 网 络 上 的 划分 结果 。 图 中 横 轴 表示 重 闭 节点 占 总 节点 


的 比例 。 由 图 7 Ca) 可 以 看 出 ，G_NA 算法 的 划分 结果 优 了 
Game 算法 的 划分 结果 ; 在 图 (b) 中 ， 当 重奏 节点 数 为 0，20、 
40 时 ，G_NA 算法 的 划分 结果 优 于 Game 算法 的 划分 结果 ; 

于 节点 数 为 60 时 , G_NA 算法 的 划分 结果 略 逊 色 于 Game 算 
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法 的 划分 结果 ; SAT BION 80 时 , GNA 算法 的 划分 结果 
与 Game 算法 的 划分 结果 差距 较 大 。 因 此 ， 总 的 来 说 ，G_NA 
算法 的 划分 结果 优 于 Game 算法 的 划分 结果 。 


4 ”结束 语 


本 文 在 分 析 现 有 社区 发 现 算法 不 足 的 基础 上 ， 提 出 基于 节 
点 属性 的 社区 发 现 博弈 算法 。 针 对 已 有 算法 未 考虑 节点 属性 天 
节点 策略 选择 影响 的 局 限 性 ， 提 出 具有 节点 度 值 比例 的 增益 函 
数 ， 针 对 已 有 算法 未 考虑 节点 属性 对 节点 在 网 络 中 选择 顺序 影 
向 的 不 足 ， 提 出 基于 节点 重要 度 排 序 的 博弈 论 社 区 发 现 算法 ; 
在 基于 节点 重要 度 初始 化 的 博弈 论 社区 发 现 算法 中 ， 节 点 按照 
重要 度 从 大 到 小 排序 ， 并 依次 选择 加 入 社区 、 离 开 社 区 或 转换 
社区 的 策略 提高 收益 ， 直 到 所 有 节点 不 能 增 大 其 收益 。 

在 接 下 来 的 工作 中 将 更 多 地 结合 博弈 论 与 社区 发 现 的 本 质 
提出 更 适合 社区 发 现 的 收益 函数 。 另 外 在 对 本 文 算 法 的 实验 过 
程 中 发 现 节点 更 多 地 考虑 加 入 自身 邻接 节点 所 在 的 社区 ， 因 此 
在 接 下 来 的 工作 中 可 以 设置 节点 的 策略 为 其 邻接 节点 社区 的 选 
择 。 


参考 文献 : 


E 


x 


xe 


[1] Kunegis J. Social network datasets [M]. New York: Springer, 2017. 

[2] Wee. 基于 遗传 优化 的 复杂 网 络 社区 检测 技术 研究 [D]. 南京 . 南京 邮 
电大 学 , 2017. (Yao Ying. Research on complex network community 
detection technology based on genetic optimization [D]. Nanjing: Nanjing 
University of Posts and Telecommunications, 2017. ) 

[3] RE, HAH. 复杂 网 络 [M]. 上 海 : 上 海 科 技 教育 出 版 社 , 2006. (Guo 
Lei, Xu Xiaoming. Complex network [M]. Shanghai: Shanghai Science 
and Technology Education Press, 2006. ) 

[4] Wei Chen, Zhenming Liu, Xiaorui Sun, et al. A game-theoretic framework 
to identify overlapping communities in social networks [J]. Data Mining & 
Knowledge Discovery, 2010, 21 (2): 224-240. 

[5] Rubinstein, Ariel. A course in game theory [M]. [S. 1. ] : MIT Press, 1994. 

[6] Aumann R J, Brandenburger A. Epistemic conditions for Nash equilibrium 
[M]// Readings in Formal Epistemology. [S. 1. ] : Springer International 
Publishing, 2016: 113-136. 

[7] Monderer D, Shapley L S. Potential games [J]. Games & Economic 
Behavior, 1996, 14 (1): 124-143. 

[8] Alvari H, Hashemi S, Hamzeh A. Detecting overlapping communities in 
social networks by game theory and structural equivalence concept [M]. 
Berlin: Springer, 2011. 

[9] Zhou Xu, Zhao Xiaohui, Liu Yanheng, et al. A game theoretic algorithm to 
detect overlapping community structure in networks [J]. Physics Letters A, 
2018, 382 (13): 872-879. 

[10] Zhang Xiankun, Ren Jing, Song Chen, et al. Label propagation algorithm 
for community detection based on node importance and label influence [J]. 


Physics Letters A, 2017, 381 (33): 2691-2698. 


201811.00166v1 


chinaXiv 


[11] Zachary W W. An information flow model for conflict and fission in small 
groups [J]. Journal of Anthropological Research, 1977, 33 (4): 452-473. 

[12] Lusseau D, Schneider K, Boisseau O J, et al. The bottlenose dolphin 
community of doubtful sound features a large proportion of long-lasting 
associations [J]. Behavioral Ecology and Sociobiology, 2003, 54 (4): 
396-405. 

[13] Yang Liang, Cao Xiaochun, He Dongxiao, et al. Modularity based 
community detection with deep learning [C]// Proc of International Joint 
Conference on Artificial Intelligence. [S. 1. ] : AAAI Press, 2016: 
2252-2258. 

[14] Newman M E J. Modularity and community structure in networks [J]. 
Proceedings of the National Academy of Sciences, 2006, 103 (23): 


8577-8582. 


张 贤 坤 ， 等 : 基于 节点 属性 的 社区 发 现 博弈 算法 


ChinaXiv 合 作 期 刊 


73 1 期 


[15] Girvan M, Newman M E J. Community structure in social and biological 
networks [J]. Proc. Natl Acad. Sci. USA. 2002, 99 (12): 7821-7826. 

[16] Lancichinetti A, Fortunato S, Kertész J. Detecting the overlapping and 
hierarchical community structure of complex networks [J]. New Journal of 
Physics, 2008, 11 (3): 19-44. 

[17] Lancichinetti A, Fortunato S. Benchmarks for testing community detection 
algorithms on directed and weighted graphs with overlapping communities 


[J]. Physical Review E, 2009, 80 (1): 16118. 


